由于数据保护法和机构内的官方程序,在实践中很难在机构之间共享医疗数据。因此,大多数现有的算法经过相对较小的脑电图(EEG)数据集的培训,这可能会损害预测准确性。在这项工作中,我们通过将公开可用的数据集分配到代表各个机构中数据的不相交集中来共享数据时模拟了一个情况。我们建议在每个机构中培训一个(本地)检测器,并将其个人预测汇总为最终预测。比较了四个集合计划,即多数投票,平均值,加权平均值和Dawid-Skene方法。该方法仅使用EEG通道的一个子集在独立的数据集上进行了验证。当每个机构提供足够数量的数据时,合奏的精度与对所有数据进行训练的单个检测器相当。加权平均聚合方案表现出最佳性能,当局部检测器接近对所有可用数据训练的单个检测器的性能时,它只能用DAWID-SKENE方法略有优于。
translated by 谷歌翻译